我们将最初在多维扩展和降低多元数据的降低领域发展为功能设置。我们专注于经典缩放和ISOMAP - 在这些领域中起重要作用的原型方法 - 并在功能数据分析的背景下展示它们的使用。在此过程中,我们强调了环境公制扮演的关键作用。
translated by 谷歌翻译
尽管像主组件分析一样,经典缩放是无参数的,但大多数用于嵌入多元数据的方法都需要选择一个或几个参数。由于情况的无监督性,这种调整可能很困难。我们提出了一种简单,几乎明显的方法来监督调整参数的选择:最大程度地减少压力的概念。我们通过参考刚性理论来证实这种选择。我们扩展了Aspnes等人的结果。 (IEEE移动计算,2006年),表明一般的随机几何图形是具有很高概率的三材料图。我们提供了稳定结果\ a la anderson等。 (SIAM离散数学,2010年)。我们在Shang和Ruml的MDS-MAP(P)算法的背景下说明了这种方法(IEEE Infocom,2004)。作为一种典型的补丁方法,它需要选择补丁大小,我们使用压力来使该选择数据驱动。在这种情况下,我们执行许多实验来说明使用应力作为调整参数选择的基础的有效性。这样一来,我们揭示了一个偏见差异的权衡,这是一种现象,在多维缩放文献中可能被忽略了。通过将MDS-MAP(P)变成一种流形学习方法,我们获得了ISOMAP的局部版本,为此,应力最小化也可以用于参数调整。
translated by 谷歌翻译
在1970年代的两个重要非参数方法中出现了群集的:级别集或群集树,由Hartigan提出的级别树木,并通过福卢加和旅馆提出的梯度线或渐变流的聚类。在最近的一篇论文中,我们认为这两种方法的目的是根本值的,通过表明梯度流提供了沿着簇树移动的方法。在制作更强大的情况下,我们面临的事实是群集树没有定义底层密度的整个支持的分区,而梯度流动。在本文中,我们通过提出从群集树中获取分区的两种方法来解决这一难题 - 其中一个人在其自己的右侧非常自然 - 并且显示它们两者都减少到梯度流给出的分区根据对采样密度的标准假设。
translated by 谷歌翻译
本文在20世纪70年代出现的两个重要聚类方法之间建立了强大的对应方法:级别集或群集树的聚类,如Hartigan提出的梯度线或渐变线或福卢加和大学家所提出的梯度流。我们这样做通过显示我们可以通过遵循渐变上升流来向上移动群集树。
translated by 谷歌翻译